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摘要 : [目的 /意义 ] 针对 目前 认 久 


谱 见 杂 导 致 过 高 认 知 负荷 等 问题 ， 


融合 激活 扩散 模型 中 的 能 量 的 获得 分 配 与 衰减 、 激 活 状态 判断 、 


1 图 谱 缺 乏 通用 赋值 机 # 


判 、 检 索 或 推理 过 程 解释 力 不 足 、 图 


提出 一 种 基于 激活 扩散 模型 的 认 知 图 谱 构建 方法 , 来 优化 
认 知 图 谱 的 权重 分 配 并 进一步 提高 认 知 智能 。[ 方 法 /过 程 ] 首先 , 分 析 认 知 图 谱 目 前 的 局 限 


性 并 提出 解决 方案 。 其 次 , 以 解决 方案 为 依据 设计 基于 激活 扩散 模型 的 认 知 图 谱 构 建 过 程 并 


激活 范围 限制 等 计算 公式 ， 


提出 了 基于 激活 扩散 模型 的 认 知 图 谱 构 建 方法 。 [结果 /结论 ] 通过 对 本 文 提出 的 激活 扩散 模 
型 与 传统 的 基于 频次 统计 的 认 知 图 谱 构建 权重 计算 方法 作 的 对 比试 验 , 结果 显示 基于 激活 扩 
散 模型 的 认 知 图 谱 具 有 更 强 的 细节 揭示 能 力 和 一 定 的 灵活 性 、 可 以 呈现 更 多 层次 的 权重 分 布 ， 
E 明 构建 结果 的 因果 不 对 称 性 。 基 于 激活 扩散 模型 的 认 知 图 
谱 构建 权重 计算 方法 对 提升 认 知 图 谱 的 认 知 智能 有 着 明显 的 效果 , 可 以 形成 具有 认 知 偏好 和 


目 权 重 赋值 具有 可 笔 性 ,并 可 以 说 


差异 的 认 知 图 谱 。 


关键 词 : 认 知 图 谱 ; 
分 类 号 : G250 


1 引言 


随 着 人 工 智能 相关 下 


激活 扩散 模型 ， 权 重 计算 ; 认 知 智能 ; 


能 相关 应 用 得 以 解决 。 然 而 即使 处 于 智能 化 的 今天 ， 人 了 
的 质疑 。 这 是 因为 目前 出 现 的 人 工 智能 大 多 是 由 大 数据 好 


杂 模 型 的 多 层 计 算 ， 而 这 个 过 程 


认 知 智能 。 其 中 计算 智能 是 以 数据 为 基础 通过 手段 建立 3 


于 缺乏 可 解释 


激活 能 量 


究 的 高 速 发 展 , 人 类 客观 世界 中 的 诸多 领域 问题 都 可 以 使 用 人 工 智 
[智能 的 “智能 ”仍然 受到 许多 学 者 


于 


K 动 ， 其 任务 的 完成 通 第 需要 经 过 复 


的 机 制 而 被 认为 是 一 种 “黑箱 ”。 对 于 人 
工 智能 中 的 “智能 ”的 理解 ， 虽 然 不 同 的 学 者 持 有 不 同 的 观点 ， 但 大 多 都 同意 “模拟 、 扩 展 、 
延伸 人 类 智能 ”的 这 一 说 法 ,人 工 智能 最 开始 就 是 以 人 类 作为 参照 , 实现 对 人 类 认 知 、 思 考 、 
决策 的 模拟 。 也 有 学 者 将 人 工 智能 的 智能 分 为 了 三 个 发 展 阶段 : 即 计 算 智 能 、 感 知 智能 以 及 


功能 模型 ， 而 感知 智能 则 是 对 数据 的 


大 规模 采集 与 结构 化 处 理 , 而 认 知 智能 则 需要 机 器 共有 主动 思考 和 理解 的 能 力 , 可 以 实现 自 


我 学 习 。 为 了 实现 认 知 


步 为 认 知 智能 开拓 了 新 的 道路 ， 
组 织 管理 大 量 数据 信息 。 


?能 ， 学 者 们 意识 到 了 “语言 ”在 人 工 智能 学 习 中 处 于 重要 地 位 , 自 
然 语言 处 理 技术 得 到 了 长 足 的 发 展 , 知识 图 谱 也 逐渐 登 上 了 人 工 智 能 的 舞台 。 知 识 图 谱 进 


随 着 知识 图 谱 广 泛 地 发 展 与 应 月 
念 ， 认 知 图 谱 本 质 上 仍然 是 一 种 语义 网 络 ， 但 却 体现 出 了 比 知识 图 谱 更 强 的 
柳 、 赵 波 也 强调 “ 认 知 ”技术 是 整个 人 工 智能 看 


为 注重 于 模仿 人 类 的 认 知 ， 与 认 知心 理学 、 脑 科学 领域 相关 ， 并 跨越 领域 知识 图 谱 、 
理 、 持 续 学 习 等 技术 , 构建 稳定 获取 和 表达 知识 的 有 效 机 


[Ul 


因为 它 在 数据 描述 能 力 上 其 有 足够 的 优势 , 可 以 从 语义 层面 
述 客 观 世 界 中 存在 的 各 种 实体 以 及 它们 之 间 的 联系 , 也 可 以 有 效 地 


月 ， 逐 渐 衍 生出 了 认 知 图 谐 〈cognitive graph) 这 一 概 


E 理 能 力 。 张 玉 


发 中 绕 不 开 的 关键 技术 ,而 认 知 图 谱 正 是 知 
识 图 谱 与 认 知 智能 的 结合 "。 对 于 认 知 图 谱 的 定义 ， 国 内 外 仍然 未 有 完全 定论 ， 但 可 以 概括 


因 末 推 
中， 让 知识 能 被 机 器 理解 和 运用 以 


E 论 ”为 基础 ， 具有 更 强大 、 更 灵 


实现 认 知 智能 的 突破 。 认 知 图 谱 常 以 心理 学 中 的 “ 双 通 道 玫 
活 的 推理 能 力 。 双 通道 理论 认为 人 类 推理 系统 由 一 个 隐 愧 


组 成 的 ? 
多 辑 推 天 


加 工 多 


(Systeml ) 以 及 一 个 明确 的 、 


意识 、 可 操控 的 推理 


= 二 | 


噶 、 频 率 和 联系 的 统计 规则 。 一 个 


E 间 环 ; 


结构 ， 


Peer 等 人 5 


间距 离 不 同 的 
欣 媛 , 路 通 等 人 则 认为 认 知 图 i 
的 术语 表达 ”"， 因 此 计算 机 中 四 
的 组 织 和 可 视 化 工具 , 认 知 地 图 是 在 过 去 经 验 基 而 
理学 中 也 出 现 过 类 似 
心理 


所 统 =“。 


和 知识 获得 
特点 是 具有 选择 性 。 元 成 分 则 是 对 具体 认 疾 


相 匹 配 ， 


过 程 对 收集 的 信息 进行 推理 
。 系 统 1 蔡 人 类 完成 简单 的 、 直 觉 的 思考 ,系统 2 则 蔡 人 完成 复杂 的 ， 基 于 经 验 的 
EE “”。 这 两 种 系统 一 个 是 联想 的 ， 它 的 计算 反映 了 相似 愧 
! 特 生 
其 计算 原则 基于 规则 推理 


E 的 潜意识 系统 检索 相关 的 信息 
E CSystem2) 


E 和 和 蜀 存 的 机 构 ， 负 责编 码 和 


的 ， 它 的 计算 反映 了 基于 规则 的 


EE 从 Elizabeth R. Chrastil and William H. Warren 中 以 及 Michael 


的 论文 中 也 可 以 发 现 cognitive graph 可 以 被 理解 一 种 人 脑 内 存储 的 与 欧 几 里 得 空 


I 象 后 的 拓扑 结构 ， 也 属于 
谱 是 跨 学 科 概 念 “ 认 知 地 图 ” 


的 认 知 图 


识 经 


的 术语 “图 式 ””“ 知 识 经 验 结构 ”等 ， 
学 家 斯 腾 伯 格 于 1985 年 提 #H 


成 分 ”。 知 识 获得 成 分 是 对 情境 中 的 信 ， 


知 发 展 的 重要 基础 
谱 的 构建 应 该 体现 信息 的 选择 性 、 


知 图 i 
然而 目 


机 器 学 习 和 知识 图 谱 的 构建 来 实现 认 知 图 
的 构建 上 缺乏 一 种 与 人 类 认 知 过 程 相符 合 、 提 高 认 知 图 谱 认 久 
国内 在 认 知 图 谱 的 构建 中 很 少 使 


空间 知识 的 可 做 标记 的 表示 方式 。 赵 


国庆 , 李 
(cognitive map) 在 计算 机 领域 


谱 可 以 借鉴 各 领域 中 关于 认 知 地 图 的 研究 。 作 为 知识 
上 上 建立 的 代表 外 部 环境 的 内 部 表象 ,在心 


它们 都 可 以 被 术语 “ 认 知 结构 ” 


有 关 个 体 认 知 结构 的 三 成 分 :元 成 分 、 操 作成 分 
电 进 行 筛选 抉择 ， 并 将 寺 
过程 中 的 其 他 成 分 进行 


信息 与 已 有 知识 


控 ， 这 是 认 


同 


1， 操 作成 分 则 是 对 问题 进行 解决 ， 包 括 编码 、 推 开 


E、 联 系 与 应 用 。 可 见 认 


认 知 结构 的 调 


控 并 有 利于 问题 的 解决 。 


前 对 于 认 知 图 谱 的 构建 常常 采用 与 知识 图 谱 构 建 相同 的 方法 , 许多 学 者 通过 结合 


1 


日 


的 高 阶 “ 认 知 智能 ”。 


可 见 ， 目 前 对 于 认 知 图 谱 


Ez 
是 
及 


权重 这 一 属 怕 


识 图 i 


视 化 展示 还 是 知识 扒 


则 可 以 使 


人 类 认 知 的 基本 假设 。 


的 、 月 


现 对 认 知 图 谱 认 知 


普 领域 中 则 有 一 些 构建 带 有 权重 的 知识 


权重 的 大 小 去 表现 认 知 图 谱 中 节点 和 


天 


中 都 展示 了 


图 谱 的 案例 , 携带 权重 信 
上 了 更 优越 的 性 能 。 认 知 图 谱 中 的 节点 和 边 如 果 携 


I 智能 的 一 种 构建 方法 。 此 外 ， 


E 作 为 认 知 图 谱 的 实体 与 关系 的 信息 , 而 在 知 


谱 无 论 在 知识 可 
带 权 
或 强度 , 这 也 基本 符合 心理 学 对 


居 的 图 


重 


= 二 


因此 , 本 研究 提出 了 一 种 以 心理 


9 能 的 优化 。 


I 边 的 可 靠 性 
学 认 知 模型 一 一 激活 扩散 模型 为 基础 
于 构建 认 知 图 谱 的 方法 ， 并 通过 设计 激活 扩散 过 程 对 认 知 图 谱 动态 赋予 权重 值 ， 以 实 


上 


2 现 有 认 知 图 谱 构 建 方法 存在 的 问题 分 析 


现 有 认 知 图 谱 的 构建 方法 了 
0 图谱 能 够 实现 特定 的 检索 或 # 
web 规模 文档 的 多 跳 问答 ， 并 基于 BERT 和 图 神经 网 络 来 实现 对 隐 式 提取 模块 和 
! 系 统 的 模拟 ”。DU ZX 等 人 实现 了 一 次 性 知识 推 到 


使 认 医 


块 两 


A A, 


:要 集中 在 满足 基 


觉 与 基本 


至 


规则 的 两 种 推理 方式 上 , 从 而 


理 功能 . DING 


M 等 人 提出 一 个 新 的 CogQA 和 


EE 架 来 实现 
显 式 推理 模 


NTA 


的 认 知 图 谱 ， 该 认 知 图 谱 划 分 了 摘 


要 模块 和 # 


理 模块 ， 摘 要 模块 总 结 给 定 实例 的 基本 关系 ， 


理 模 块 据 此 推断 正确 答案 。 为 了 


补充 检索 空间 的 先 验 知识 , 在 摘要 模块 中 使 用 神经 网 络 根据 图 神经 网 络 生 成 的 实体 对 向 量 表 
示 推 新 实体 对 间 的 关系 , 推理 模块 包含 着 从 知识 图 谱 中 检索 信息 的 systeml 和 根据 收集 到 信 
息 进 行 推理 的 system2， 其 中 systenm2 使 用 深度 学 习 进 行 关系 推理 ”。 然 而 这 些 构建 认 知 图 
谱 的 方法 和 技术 本 质 上 与 构建 知识 图 谱 未 有 差别 , 仍然 存在 着 认 知 图 谱 缺 乏 通用 的 赋 权 机 制 、 
认 知 图 谱 检 索 或 推理 结果 缺乏 解释 力 、 认 知 图 谱 见 杂 易 导致 认 知 负 蓓 过 高 等 问题 。 


2.1 认 知 图 谱 缺 乏 通用 的 赋 权 机 制 


目前 对 认 知 图 谱 的 构建 存在 过 于 机 械 和 人 缺乏 通用 赋 权 机 制 的 问题 。 这 是 因为 认 知 图 谱 的 
构建 结果 完全 取决 于 输入 数据 , 而 对 于 一 般 的 知识 图 谱 赋 权 和 常 采 用 频次 统计 或 语义 距离 计算 
等 方法 赋予 权 值 , 这 会 叶 致 认 知 图 谱 的 赋 权 结果 难以 发 生 改 变 。 这 样 的 认 知 图 谱 虽 然 增加 了 
可 靠 性 , 但 同时 也 缺乏 了 灵活 性 ， 这 种 认 知 图 谱 构 建 的 方法 也 不 符合 认 知 智能 的 要 求 。 灵 活 
的 认 知 图 谱 构 建 结果 应 当 既 具有 一 定 的 可 靠 性 又 能 使 得 构建 结果 根据 数据 的 输入 顺序 不 同 
而 有 所 差异 。 王 忠 群 、 叶 安 杰 、 星 苏 斌 等 人 对 知识 图 谱 进行 赋 权 扩展 ， 再 构建 在 线 商 品评 价 
语义 网 来 计算 商品 的 可 信 度 并 排序 ” 。 孙 昊 天 、 杨 良 斌 在 统计 共 现 次 数 的 基础 上 实现 新 的 基 
于 带 权 三 元 闭 包 来 构建 时 政 类 微 博 以 亲密 程度 为 关系 知识 图 谱 ", 可 见 , 对 于 权重 的 计算 和 
赋值 , 存在 对 知识 图 谱 和 语义 网 络 赋值 的 案例 , 但 目前 并 未 出 现 一 种 通用 的 方法 实现 认 知 图 
谱 的 权重 计算 。 


2.2 认 知 图 谱 检索 或 推理 过 程 缺乏 解释 力 


现 有 的 认 知 图 谱 中 多 以 构建 基于 双 通 道 的 推理 机 制 为 重点 , 多 采用 机 器 学 习 等 方法 来 实 
现 复 杂 的 推理 功能 。 褚 润 夫 在 使 用 认 知 图 谱 设 计 井下 作业 知识 推荐 系统 研究 中 , 在 模拟 认 知 
图 谱 中 认 知 推理 模块 使 用 了 基于 上 下 文 的 图 神经 网 络 推荐 模型 ”。 囊 满 、 张 维 星 、 李 明 轩 运 
> 用 BERT+CRF 以 及 GCN 提出 了 基于 认 知 图 谱 的 智能 问答 推理 模型 ”。 以 上 认 知 图 谱 可 以 取得 
6 很 好 的 应 用 效果 ， 但 常常 由 于 其 黑箱 机 制 而 不 具备 强 解释 力 。 

而 认 知 图 谱 作 为 认 知 智能 的 延伸 需要 在 检索 、 推理 机 制 中 具有 认 知 的 可 解释 特征 。 这 需 
要 认 知 图 谱 能 够 解释 检索 结果 或 推理 结果 , 即 为 什么 对 该 问题 的 检索 和 推理 结果 是 A 而 不 是 
Be 


2.3 认 知 图 谱 元 杂 导 致 过 高 的 认 知 负荷 


在 现 有 的 认 知 图 谱 构建 过 程 中 , 相同 实体 的 合并 不 会 对 实体 间 的 链接 产生 影响 , 即 在 认 
知 图 谱 中 链接 只 有 关系 类 型 的 区 分 而 没有 链接 强度 的 表示 , 这 不 利于 对 认 知 图 谱 中 链接 的 重 
要 程度 进行 判断 ， 这 会 导致 认 知 图 谱 可 视 化 的 结果 见 余 过 高 ,很 难 从 中 收获 重要 的 信息 ,而 
链接 强度 可 以 解释 为 可 靠 性 和 重要 性 。 在 知识 图 谱 研 究 中 , 有 人 提出 完整 的 知识 图 谱 呈 现 将 
给 学 习 者 带 来 超额 的 外 在 认 知 负荷 。 赵 国庆 等 人 认为 未 来 可 以 基于 认 知 负荷 理论 , 借鉴 教育 
心理 学 中 概念 图 相关 研究 的 思路 , 分别 构 建 宏观 图 、 中 观 图 和 微观 图 ， 可 以 降低 学 生 使 用 图 


示 的 认 知 负荷 "。 因 此 ， 区 分 认 知 图 谱 的 节点 层次 可 以 在 降低 认 知 图 谱 使 用 者 的 认 知 负荷 上 
具有 重要 价值 ， 认 知 图 谱 的 实体 也 应 该 通过 不 同 的 强度 加 以 区 分 和 标记 ， 以 体现 认 知 图 谱 中 
实体 地 位 的 不 同 。 


3 基于 现 有 认 知 图 谱 局 限 性 的 解决 方案 


为 解决 以 上 问题 ， 本 文 基 于 心理 学 认 知 理论 一 一 激活 扩散 模型 ， 提 出 一 种 携带 权重 的 、 
可 以 根据 数据 动态 输入 而 灵活 变化 的 认 知 图 谱 构 建 方法 , 目的 是 提高 认 知 图 谱 的 解释 力 和 认 


知 智能 。 


3.1 以 迭代 方式 推动 认 知 动态 构建 


一 迭代 法 是 在 计算 数学 中 , 一 种 不 断 用 变量 的 旧 值 递 推 新 值 的 过 程 也 , 是 用 计算 机 解决 问 
> 题 的 一 种 基本 方法 。 在 心理 学 中 ,“ 认 知 结构 ”的 不 断 变 化 依赖 着 已 有 知识 与 外 界 信息 之 间 
的 交互 ， 从 而 推动 认 知 结构 的 调整 和 变化 , 迭代 法 则 是 实现 新 知识 融入 已 有 知识 结构 的 有 效 
手段 , 使 用 过 代 方式 构建 认 知 图 谱 , 使 每 次 迭代 的 结果 都 与 上 一 次 迭代 的 认 知 图 谱 的 结果 密 
切 相关 。 现 有 的 认 知 结构 和 新 的 认 知 结构 不 断 地 进行 同化 和 顺 化 的 迭代 过 程 , 在 其 发 展 过 程 
中 就 是 习 得 新 知识 的 过 程 ”。 目 前 在 认 知 图 谱 的 构建 中 有 应 用 迭代 方法 ，Ding M 等 人 提出 
的 基于 认 知 图 谱 的 问答 系统 中 就 通过 夫 代 systeml 和 system2 来 逐步 构建 认 知 图 谱 ”。Du Z 
等 人 提出 的 应 用 于 一 次 性 知识 图 谱 推理 的 认 知 图 谱 模型 也 通过 在 认 知 图 谱 上 迭代 地 实行 
扩展 和 推理 来 模仿 人 类 的 推理 过 程 ”。 可 见 使 用 和 迭代 方式 构建 认 知 图 谱 有 其 必然 性 和 合理 性 ， 
它 模仿 了 人 类 认 知 结构 的 演变 过 程 并 使 得 认 知 图 谱 具 有 更 强 的 解释 力 。 


3.2 以 激活 扩散 模型 为 权重 计算 机 制 


oo 认 知 图 谱 的 本 质 仍然 是 一 种 语义 网 络 , 为 了 让 网 络 中 的 节点 和 链接 具有 不 同 的 强度 , 需 
要 确定 网 络 中 的 权重 计算 机 制 ,例如 , 在 国内 , 刘 现 等 人 为 提高 引文 网 络 社区 划分 的 准确 性 ， 
构建 了 基于 词汇 语义 加 权 的 引文 网 络 “。 王 现 臣 则 针对 情报 分 析 中 用 户 个 性 化 需求 预测 的 问 
题 ,从 语义 特征 角度 出 发 , 提出 了 两 种 加 权 二 分 网 络 预测 算法 ”。 熊 回 香 等 人 则 通过 对 异 质 
言 息 网 络 进 行 加 权 以 实现 学 术 信 息 推 荐 ” .在 对 知识 图 谱 的 研究 中 也 存在 着 加 权 知 识 图 谱 的 
构建 ， 孙 吴 天 、 杨 良 斌 提出 了 以 带 权 三 元 闭 包 为 基础 构建 时 政 类 微 博 知识 图 谱 的 方法 ”, 王 
忠 群 等 人 则 对 知识 图 谱 进 行 赋 权 扩展 ,以 领域 常识 、 商品 测 评 和 领域 专家 作为 信息 源 构建 带 
权 知识 图 谱 …。 综 合 以 上 研究 可 以 发 现 , 对 于 权重 的 扩展 和 赋值 ， 常 使 用 领域 专家 所 设置 的 
规则 作为 赋 权 依据 ， 且 权 重 的 分 配 更 取决 于 具体 的 问题 情境 , 并 不 存在 一 种 统一 的 权重 分 配 
方法 , 这 种 由 专家 制定 规则 的 带 权 网 络 和 知识 图 谱 已 经 被 证 实 对 于 问题 解决 具有 更 好 的 效果 ， 
然而 却 仍然 缺乏 对 这 种 机 制 的 解释 , 或 者 说 带 权 网 络 和 带 权 知 识 图 谱 的 出 现 最 开始 并 未 以 提 
高 认 知 智能 为 目的 ， 而 是 以 更 好 地 解决 应 用 问题 为 目的 。 因 此 ,为 了 提高 认 知 图 谱 的 认 知 智 
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能 ， 本 研究 选择 以 心理 学 认 知 理论 一 一 激活 扩散 模型 作为 融 权 认 知 图 谱 中 的 权重 分 配 机 秆 


则 在 使 认 知 图 谱 上 共有 强 解释 力 的 认 知 智能 ， 并 起 到 调控 认 知 结构 的 作用 。 


激活 扩散 模型 (Spreading Activation Model) 是 由 1975 年 被 Collins 和 Loftus 提出 


A 


的 一 种 语义 网 络 模 型 。Collins 和 Loftus 在 Quillian 的 研究 基础 上 提出 : 在 语义 记忆 中 准 
备 的 影响 (或 启动 ) 被 解释 为 根据 从 启动 概念 节点 的 激活 扩散 。 这 是 一 个 被 设计 用 来 展示 在 
计算 机 中 如 何 构建 人 类 语义 结构 和 进程 的 理论 ,而 不 是 解释 数据 的 理论 。 激活 扩散 理论 可 以 


解释 实验 中 不 同 组 合 的 节点 会 导致 不 同 的 反应 时 间 ，Coll 


ins 和 Loftus 将 其 描述 为 : 第 一 


个 概念 启动 第 二 个 概念 的 数量 决定 着 反应 时 间 。 根 据 Yorick Wilks 的 说 法 ，“ 传 播 激 活 是 


网 络 上 的 一 种 程序 理论 ， 它 可 以 实现 一 系列 现象 ， 并 且 已 经 做 到 了 ”。 
活 和 启动 的 传播 过 程 是 相互 关联 的 一 一 这 些 现象 使 人 们 能 够 接触 到 语义 信息 , 他 认为 激活 扩 


散 机 制导 致 与 概念 高 度 关 联 〈( 占 优势 的 ) 的 属 怕 


激活 扩散 同时 是 搜索 联想 网 络 、 生 物 和 人 工 神经 网 络 或 语义 网 络 
况 下 ， 这些“ 权重 ”是 随 着 激活 通过 网 络 传播 而 衰减 的 真 值 。 当 权重 是 离散 的 ， 这 个 过 程 往 


E 可 以 更 好 地 启动 。™ 


往 被 称 为 标记 传递 。 激活 可 能 起 源 于 交 蔡 路 径 ， 


“激活 ”开始 的 ， 然 后 迭代 地 传播 或 “扩散 ”至 


的 一 种 方法 。 大 多 数 情 


Ashcraft 认为 ， 激 


由 不 同 的 标记 标识 ， 并 在 两 个 交 蔡 路 径 到 达 
同一 节点 时 终止 。 搜 索 过 程 通过 给 定 一 组 源 节点 〈 例 如， 语义 网 络 中 的 概念 ) 并 标注 权重 或 


j 其 他 与 源 节 点 相连 的 节点 。 


在 认 知 心理 学 中 ， 激 活 扩散 是 关于 大 脑 如 何 通过 相关 联 的 网 络 提取 具体 信息 的 理论 ”。 
激活 扩散 模型 意味 着 人 们 组 织 他 们 基于 个 人 经 验 的 世界 知识 , 即 那些 个 人 经 验 形成 了 思想 网 
络 ， 也 就 是 这 个 人 对 世界 的 知识 ”。 与 心理 学 领域 的 其 他 语义 网 络 模型 有 所 不 同 , 激活 扩散 


模型 抛弃 了 概念 的 层次 结构 , 选择 以 语义 联系 和 语义 相似 性 


E 等 关系 将 概念 之 间 连 接 起 来 。 概 


念 间 的 连 线 可 以 表示 它们 的 联系 , 连 线 的 长 短 可 以 表示 概念 间 的 紧密 程度 。 当 一 个 概念 受到 


刺激 时 ， 该 概念 节点 就 会 产生 激活 ,然后 激活 沿 节 点 的 连 线 同时 间 四 周 扩散 ， 与 这 个 节点 联 


系 越 紧密 的 节点 接受 激活 的 速度 越 快 , 强度 越 大 , 因 激 活 量 有 限 , 随时 间 的 推移 和 距离 变 远 ， 
激活 在 网 络 中 的 扩散 逐渐 减弱 ， 当 沿 不 同 连 线 扩散 的 激活 在 某 一 个 节点 上 交叉 , 并 使 其 获得 
的 激活 总 量 达 到 闵 限 时 ， 产生 这 种 交叉 的 网 络 通 路 会 受到 评 佑 ， 根据 评估 的 结果 ,网 络 做 出 
提取 某 种 信息 的 决策 。 激 活 扩散 模型 属于 预存 式 模 型 ， 但 要 使 用 搜索 和 决 
在 检索 的 过 程 中 , 激活 扩散 从 外 界 信息 所 刺激 的 节点 产生 并 根据 该 语义 网 络 中 各 单元 的 紧密 


程度 进行 路 径 检索 。 


策 两 个 加 工 环节 。 


通过 对 激活 扩散 模型 进行 分 析 , 我 们 可 以 发 现 激活 扩散 模型 是 一 种 以 网 络 为 结构 , 符合 


人 类 认 知 灵活 性 , 足以 实现 检索 功能 和 权重 计算 的 心理 学 理论 模型 ， 该 模型 完美 契合 了 认 知 


图 谱 的 结构 、 属 性 以 及 处 理 信 息 数 据 的 方式 。 本 文 尝试 将 激活 扩散 模型 作为 认 知 图 谱 中 的 权 
重 增 加 机 制 , 将 认 知 图 谱 的 权重 变化 视 为 认 知 模型 中 网 络 中 边 和 节点 的 权重 调整 ， 以 此 得 到 


认 知 图 谱 权 重 分 配 的 规则 。 


Ps 
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3.3 数据 输入 与 图 谱 构建 同时 进行 


在 传统 的 知识 图 谱 和 认 知 图 谱 构 建 中 ,通常 采用 两 种 构建 方式 一 一 自 顶 则 下 (top-down) 
的 构建 方式 与 自 底 向 上 (bottom-up) 的 构建 方式 ， 其 区 别 在 于 定义 本 体 和 加 入 实体 的 先后 ， 
自 顶 向 下 的 构建 方式 需要 先 定义 好 本 体 和 数据 模式 , 再 将 实体 加 入 知识 库 , 而 自 底 向 上 则 是 
从 一 些 开放 链接 数据 中 提取 实体 加 入 知识 库 再 构建 顶层 的 本 体 模 式 。 在 知识 图 谱 的 构建 技术 
方面 ， 刘 峰 等 人 提出 的 知识 图 谱 技术 框架 包含 了 信息 抽取 、 知 识 融 合 和 知识 加 工 的 过 程 ”。 
徐 增 林 等 人 则 认为 知识 图 谱 构 建 的 关键 技术 主要 包含 知识 抽取 、 知 识 表 示 、 知 识 融 合 、 知 识 
推理 四 类 ”。 综合 多 数学 者 的 研究 可 以 发 现 , 构建 认 知 图 谱 的 主要 步骤 包括 信息 抽取 、 本 体 
构建 、 知 识 融 合 、 知 识 表示 ， 即 构建 认 知 图 谱 的 知识 在 构建 前 已 经 得 到 确定 和 处 理 ， 这 样 的 
好 处 是 构建 出 的 图 谱 具 有 良好 的 结构 , 每 个 实体 都 具有 较 高 的 价值 , 但 也 存在 缺乏 实体 之 间 
影响 ， 不 够 灵活 的 缺点 。 


综合 以 上 研究 ， 为 了 能 够 实现 动态 地 、 能 够 跟随 信息 变化 而 构建 认 知 图 谱 ， 本 文 使 用 
项 向 下 的 构建 方式 ， 事 先 对 认 知 图 谱 的 本 体 进行 定义 ， 然 后 再 根据 信息 不 断 地 加 入 实体 ,并 
在 加 入 实体 的 同时 构建 认 知 图 谱 并 可 视 化 , 即 信息 抽取 、 知 识 融 合 以 及 知识 表示 步骤 将 同时 


进行 。 
4 基于 激活 扩散 模型 的 认 知 图 谱 构建 


本 研究 中 ,我 们 假设 概念 就 是 认 知 图 谱 中 的 一 个 个 实体 , 反映 在 网 络 中 就 是 一 个 个 节点 ， 
因此 , 在 激活 扩散 机 制 下 , 我 们 通过 认 知 图 谱 中 的 权重 来 表现 概念 之 间 的 关联 属性 ， 并 通过 
使 用 激活 扩散 模型 中 的 计算 机 制 , 更 新 认 知 图 谱 的 权重 , 将 新 的 权重 作为 下 一 次 激活 扩散 行 
为 的 判断 依据 .在 进行 激活 扩散 的 过 程 中 ,检索 路 径 经 过 的 节点 均 存在 不 同 程度 的 记忆 增强 ， 
体现 在 数值 上 就 是 权重 的 增加 。 图 1 为 基于 激活 扩散 模型 的 认 知 图 谱 构建 方法 的 全 流程 图 。 
首先 从 文本 数据 中 按照 依存 句法 进行 信息 抽取 , 抽取 内 容 包含 实体 抽取 、 关 系 抽取 以 及 属性 
抽取 , 信息 抽取 后 形成 的 实体 根据 已 定义 的 本 体 参与 图 谱 构 建 , 在 实体 进入 图 谱 后 进行 激活 
扩散 的 计算 ， 并 给 予 参与 计算 的 实体 权重 值 并 存 入 更 新 数据 库 。 


硬 
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图 1 


获得 相关 实体 记录 


存 入 、 更 新 数据 库 


基于 激活 扩散 模型 相关 理 


中 ， 四 个 环节 交 蔡 进 行 ， 可 见 


激活 失败 


a 表示 节点 或 边 传递 的 能 量 值 。 


基于 激活 扩散 模型 的 认 知 图 谱 构建 流程 图 


论 ， 本 文中 的 激活 扩散 过 程 包含 : 激活 能 


能 量 值 的 衰减 、 激 活 状态 的 判断 、 激 活 范围 的 限制 四 个 环节 。 在 激活 扩散 不 断 选 代 的 过 程 
下 图 : 


Step1.x 激活 源 分 配 能 量 


Step2. 豪 减 激 活 能 量 


Step3. 节 点 获得 激活 能 量 
Step4. 判 断 激活 状态 是 否 
限 ， 大 于 则 激活 成 功 
Step5. 激 活 成 功 节点 继续 


图 2 激活 扩散 模型 步骤 


图 中 我 们 使 用 A 来 表示 激活 扩散 中 节点 的 能 量 ， 下 标 表 示 对 应 节点 


4.1 激活 能 量 的 获得 与 分 配 


在 激活 阶段 ， 一 个 节点 到 


中 


量 的 获得 与 分 配 、 激 


于 阅 


向 下 传 


递 ， 经 过 衰减 传递 到 下 一 节点 


Step6. 下 一 节点 重复 步骤 3 


，T 表 示 激 活 浆 限 ， 


长 他 连接 节点 之 间 存 在 大 量 的 激活 通道 。 如 


E 一 个 简单 单元 水 平 


上 ， 纯 粹 激活 扩散 模型 的 单元 输入 计算 遵循 以 下 公式 (1): 
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表示 与 节点 j 链接 的 单元 i 的 输出 ; 


时 中， 了。 ， 表示 节点 j 的 总 输入 ，O 


w ，， ”表示 连接 节点 i 和 节点 j 的 链接 权重 安 。 


iJ 


在 纯粹 激活 扩散 中 ， 一 个 单元 的 “激活 ”与 单元 的 “输出 ”之 间 没 有 区 别 ， 单 元 的 激活 
水 平 即 视 为 它 的 输出 值 “， 所 以 将 输出 值 作为 输入 值 的 函数 进 计 算 ， 表 示 为 公式 (2): 


Re 


Anderson 则 在 他 提出 的 记忆 的 激活 扩散 理论 中 ， 提 出 激活 源 发 射 的 激活 量 是 它们 强度 
的 函数 ,如果 节点 n, 收 到 来 自 于 nn 到 ni 的 激活 av 到 av, 它 的 激活 水 平 则 是 >， a ， 


y 


节点 0 发 送 到 节点 n, 到 n, 的 激活 决定 于 每 个 节点 的 强度 s 到 sj; 以 及 节点 n, 的 激活 水 平 。 如 
果 该 市 点 的 激活 水 平 是 a.， 它 发 送 到 市 点 ni 的 激活 量 束 是 ! a 、s 1/ 


I 州 刘 权 审 1 与 术 大 
A 


若海 0。 风 有 以 下 公 珠 (8) ”。 


0 = 0 人 人 


其 中 ，ec, 是 来 自 于 激活 源 的 激活 量 ， 当 y 不 是 激活 源 的 时 候 ，c,=0 
综 上 ， 本 文 激活 扩散 模型 能 量 分 配 的 计算 公式 以 及 相对 权重 的 计算 公式 ， 在 对 节点 x 
的 激活 能 量 进行 分 配 时 可 以 表示 如 公式 (4): 


a 三 友 六 一 一 关 趟 下 明 


公式 〈4) 表示 从 xX 节点 传 入 y 节点 的 能 量 分 配 公式 ， 使 用 边 权 重 计算 ， 其 中 


为 相对 权重 。 其 中 a 。 、 为 节点 x 输出 的 激活 能 量 ，a 为 节点 y 接收 的 激活 能 量 ， 


y 


W 为 节点 x 到 节点 y 的 激活 通路 的 权重 , 也 就 是 边 权重 ,>,W ,xy ) 则 为 围绕 并 连 


Xy 


接 节 点 x 的 所 有 边 权重 之 和 ， 而 围绕 并 连接 节点 x 的 所 有 边 权 重 之 和 为 节点 x 的 节点 权重 。 


此 外 ， 对 于 激活 源 能 量 的 获取 ， 由 于 其 能 量 不 是 通过 接收 获得 的 ， 因 此 需要 系统 赋予 其 
初始 值 。 激 活 扩散 模型 中 的 激活 源 (sources of activation) 是 最 开始 被 激活 的 节点 ， 也 
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论文 中 将 其 称 为 注意 单元 (focused units)。 这 里 我 们 使 用 激活 源 作 为 激活 的 原点 。 激 活 
源 的 能 量 就 是 激活 源 作 为 激活 的 原点 进行 激活 扩散 前 所 具有 的 能 量 。Anderson 曾 认为 激活 
源 发 射 的 激活 量 是 它们 强度 的 函数 ,因此 在 激活 扩散 的 过 程 中 , 在 赋予 激活 源 能 量 时 最 好 
将 节点 权重 作为 考量 因素 。 

综 上 ， 由 于 对 数 函 数 具 有 递增 得 先 快 后 慢 的 特点 ， 且 对 于 选取 不 同 数量 级 的 数据 能 够 将 
映射 值 控 制 在 较 低 水 平 范围 所 以 选取 对 数 函 数 y=lnx 作为 函数 对 节点 权重 值 进行 映射 , 其 
映射 结果 作为 激活 源 能 量 。 设 激活 源 能 量 为 A;， 激 活 源 节点 权重 为 su mm 


weig ht ， , 则 有 公式 (5): 
A ， =In(sum weig 证  ) 公式 (8) 
4.2 激活 能 量 值 的 衰减 


在 局 发 式 原则 中 ,两 个 节点 之 间 的 关系 强度 随 着 其 语义 距离 的 增加 而 减少 。 因 此 可 以 认 
为 距离 限制 的 激活 扩散 模型 中 需要 采用 广度 优先 的 方式 进行 扩散 , 即 先 考虑 一 阶 关 系 ， 再 考 
虑 二 阶 关系 。 其 中 ,直接 连接 的 两 个 节点 之 间 的 关系 称 为 一 阶 关 系 。 通 过 一 个 中 间 节 点 连接 
的 两 个 节点 之 间 的 关系 被 称 为 二 阶 关系 , 而 这 种 与 扩散 相关 的 条 件 是 可 以 根据 具体 应 用 进行 
灵活 设置 。 对 应 在 激活 能 量 值 上 ， 则 表现 为 激活 能 量 值 的 衰减 ， 衰 减 是 指 激活 能 量 值 随 着 时 
间 产 生 了 衰退 , 这 里 可 以 理解 为 随 着 节点 距离 的 增加 能 量 产生 了 衰减 。 因 此 也 有 学 者 针对 衰 
减 提出 了 一 些 计算 方法 。 例 如 : 盛 向 在 定义 激活 扩散 过 程 遵循 的 原则 中 使 用 上 一 时 刻 的 输出 
乘 以 边 的 连接 再 乘 以 〈1-a ) 作为 下 一 时 刻 的 输入 ， 可 表示 为 如 下 公式 ”: 


i Wy 0 ) RG 
A 0 (Ry A Ol 
点 Xx 在 t 时 刻 的 输出 ，w 为 节点 x 与 y 的 连接 ， 而 a 为 衰减 因子 ， 表 示 激 活 


i 殉 避 
扩散 过 程 中 能 量 的 衰减 ， 而 a 一 般 取 值 0. 2。 
Anderson 在 他 提出 的 记忆 的 激活 扩散 理论 中 也 考虑 了 激活 损失 ， 若 某 节 点 的 激活 水 平 


是 C 、， 它 发 送 到 节点 n /的 激活 量 就 是 a 、，s i /于 ，s ) ， 这 里 
1 ”为 激活 中 的 损失 ， 可 以 发 现 公式 (3) 中 x 节点 沿 某 条 边 向 y 节点 传递 的 能 量 为 ， 能 量 


损失 、 两 节点 间 边 的 相对 权重 、 节 点 的 能 量 三 者 的 乘积 。 


再 如 , 洪 昆 辉 ” 提 出 的 心理 信息 激活 的 公式 ,他 提出 心理 状态 单个 状态 变量 的 表达 公式 ， 
表示 为 公式 (7): 


EC ,6 -=PE ,tf -+A ,tt -= GC ,i 


[s 
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其 中 (x ,t ”一 1) 表 示 对 象 x 在 t-1 时 刻 的 存在 程度 ， 它 等 于 对 象 x 在 t-2 时 
刻 的 存在 程度 加 上 A (x ,t ”一 1) (对 象 x 在 t-1 时 刻 受 到 的 激活 启动 效应 ) 与 d 
(X ”,t ”) (同时 期 启动 效应 的 衰退 量 ) 的 乘积 ， 而 同时 期 启动 效应 的 衰退 量 可 表达 为 公 
式 (8): 


(et 人 (8 


本 文中 采用 公式 〈6) 中 线性 衰减 的 方式 作为 衰减 函数 ， 并 表达 为 公式 (9) : 


人 


其 中 loss (x) 表示 节点 x 接收 能 量 过 程 中 的 损失 过 程 函数 ，A 


值 。 


4.3 激活 状态 的 判断 


在 对 输出 进行 的 评估 方面 , 常常 使 用 一 些 函 数 来 评估 输出 , 其 中 广 为 使 用 的 函数 为 阐 值 
函数 ， 常 用 来 确定 节点 是 否 被 激活 ， 其 原理 为 设置 一 个 闪 值 ， 当 节点 j 的 输入 值 大 于 所 设置 
的 阔 值 则 节点 j 被 激活 , 否则 认为 节点 j 不 是 活跃 的 。 闵 值 的 设置 可 以 根据 具体 的 应 用 去 确 
定 ， 既 可 以 设置 为 全 局 统一 的 阔 值 ， 也 可 以 设置 为 根据 不 同 节点 而 变化 的 阔 值 ”。 这 里 我 们 
设置 激活 闵 限 7 为 一 个 固定 值 0. 2， 这 是 由 于 我 们 已 经 将 激活 源 能 量 值 设 置 为 与 节点 权重 有 
关系 的 值 了 , 如 果 再 将 激活 阔 限 值 设置 为 一 个 随 着 节点 权重 变化 的 值 就 会 出 现 知识 图 谱 中 权 
重 较 高 的 节点 将 比 起 权重 较 低 的 节点 更 容易 被 激活 , 网 络 中 的 权重 将 更 倾向 于 权重 更 高 的 节 
点 ， 这 种 机 制 对 于 权重 偏 低 但 与 其 他 节点 联系 较 多 的 节点 不 公平 。 


、 表示 x 未 损失 的 原始 


当 激 活 闵 限 值 了 为 0.2 时 , 则 节点 接收 到 的 能 量 若 达到 0. 2 则 该 节点 会 被 激活 , 若 节 点 
接收 到 的 能 量 小 于 0.2， 则 该 节点 不 会 被 激活 。 若 x 节点 最 后 接收 到 的 能 量 为 A,， 则 有 : 


is CC atre = 
true 7; 人 x 宇 了 
| 公式 (10) 
false dh 
4.4 激活 范围 的 限制 


如 果 想 把 激活 扩散 限制 在 指定 范围 内 进行 , 就 需要 对 激活 扩散 的 深度 进行 限制 。 深度 则 
表示 一 个 激活 源 节点 x 向 下 扩散 的 最 大 路 径 数 ， 当 节点 x 传递 到 下 一 级 节点 , 即 节 点 x 的 
级 节点 则 扩散 深度 为 1， 传 到 二 级 节点 则 扩散 深度 为 2， 通 过 深度 来 控制 激活 扩散 的 扩散 范 
围 。 例 如 图 3， 当 深度 为 3 时 , 节点 x 最 大 扩散 路 径 数 为 3， 则 节点 x 可 以 从 三 条 路 径 传 递 激 


活 能 量 ， 激 活 能 量 扩散 到 的 节点 路 径 分 别 为 x->a->b->c、x->d、x->e->f->g， 这 里 节点 


不 在 扩散 范围 ， 这 是 因为 从 x 到 经历 了 四 条 路 径 ， 即 节点 bh 对 于 节点 x 的 深度 为 4， 因 此 
不 在 激活 扩散 的 范围 内 。 


图 3 激活 扩散 深度 控制 


5 基于 激活 扩散 模型 构建 的 认 知 图 谱 应 用 效果 分 析 

为 了 对 比 本 文 提出 的 认 知 图 谱 构 建 方法 与 传统 的 带 权 知 识 图 谱 构建 方法 构建 出 的 可 视 
化 图 谱 的 效果 ， 选 择 中 国 神话 故事 作为 实验 材料 ,进行 对 比 实验 ， 这 里 传统 带 权 知识 图 谱 选 
择 了 基于 统计 频次 的 带 权 知 识 图 谱 。 


5.1 认 知 图 谱 可 视 化 演化 进程 

本 研究 通过 对 比 基 于 激活 扩散 模型 的 认 知 图 谱 构 建 方 法 与 根据 频次 统计 赋 权 的 认 知 图 
谱 构 建 方法 (权重 大 小 按照 频次 的 三 倍 进行 赋 权 ) 的 差异 , 分别 选择 不 同样 本 量 的 篇 章 作 为 
实验 材料 ， 见 表 1， 可 以 展示 出 认 知 图 谱 随 着 篇 章 量 增加 的 演化 进程 。 


表 1 实验 语 料 


语 料 及 序号 组 别 ”实验 语 料 序号 分 配 
1. 嫦娥 奔 月 2. 共 工 触 天 3. 后 弹射 日 一 给 1 

4. 精 卫 填 海 5. 夸 父 逐日 6. 鲤鱼 跃 龙门 

7. 重 姜 女 避 长城 8. 年 的 由 来 9. 女 娲 补 天 

10. 铁 拐 李 关 鸭 11. 五 指 山 的 由 来 12. 思 公 移 山 | 

13. 钻 木 取 火 14. 八仙 过 海 15. 仓 颜 造 字 4 

16. 大 各 治水 17. 孔雀 公主 18. 龙 伯 钓 鳌 

19. 龙 女 拜 观音 20. 牛郎织女 21. 女 娲 升天 

22. 女 娲 造 人 23. 盘古 开 天 24. 神农 党 百草 三 组 1-15 

25. 天 将 救 人 间 
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通过 对 不 同 规模 的 实验 材料 〔 按 组 别 ) 进行 输入 《如 表 1)， 分 别 使 用 基于 频次 统计 赋 
权 的 认 知 图 谱 构建 方法 与 基于 激活 扩散 赋 权 的 认 知 图 谱 构 建 方法 , 最 终 形成 了 两 种 不 同 规模 
下 的 认 知 图 谱 ， 可 以 观察 两 种 认 知 图 谱 随 着 规模 扩大 的 演变 过 程 , 见 图 4。 图 谱 中 节点 的 大 
小 可 以 表示 节点 权重 的 大 小 , 边 的 粗细 表示 边 权 重 的 大 小 , 使 用 颜色 映射 表现 出 认 知 图 谱 中 
不 同 权重 等 级 的 节点 表示 , 颜色 越 鲜艳 表示 该 节点 权重 处 于 认 知 图 谱 中 较 高 水 平 。 其 中 标注 
Fre 的 为 基于 频次 统计 的 构建 方式 ， 标 注 为 ACT 的 为 基于 激活 扩散 模型 的 构建 方式 。 


FRE 2: 


ACT 


第 一 组 第 三 组 第 三 组 第 四 组 馈 击 旺 
CT Ol 00 5600 C1008 I 082 ITO0 ln OO C22 p22257 


图 4 基于 频次 统计 和 基于 激活 扩散 模型 构建 的 认 知 图 谱 演化 结果 对 比 


从 总 体 来 看 ， 随 着 规模 的 扩大 ， 两 种 图 谱 都 存在 一 些 高 权重 水 平 节点 的 涌现 , 但 基于 频 
次 统计 的 认 知 图 谱 其 总 体 权重 分 布 水 平 层次 较 少 且 权 重 数值 相 较 于 基于 激活 扩散 的 认 知 图 
谱 普 所 要 低 。 观察 基于 激活 扩散 模型 构建 的 认 知 图 谱 可 以 发 现 随 着 图 谱 范 围 的 增 大 , 认 知 图 
谱 的 权重 水 平分 布 呈现 多 层次 的 特点 ,在 图 中 可 以 表现 为 出 现 不 同 颜色 不 同 权 重水 平 的 代表 
性 节点 , 这些 节 点 均 上 共有 较 高 且 不 同 的 节点 权重 。 从 图 谱 整 体 上 看 , 使 用 基于 激活 扩散 模型 
的 认 知 图 谱 构 建 方法 构建 的 可 视 化 图 谱 相 较 于 使 用 频次 统计 赋予 权重 的 认 知 图 谱 , 其 节点 权 
重 呈 现 多 层次 性 , 在 少数 局 部 节点 权重 值得 到 强化 , 因此 在 可 视 化 后 更 能 够 突出 认 知 图 谱 中 
的 重要 节点 ， 这 也 在 一 定 程度 上 降低 了 认 知 图 谱 受 众 的 认 知 负 衔 。 


从 图 谱 的 局 部 来 看 ， 激 活 扩 散 过 程 赋予 了 图 谱 中 各 节点 不 尽 相 同 的 权重 增长 。 例 如 ， 第 
一 组 中 ， 在 频次 统计 认 知 图 谱 中 权重 最 高 最 为 突出 的 节点 “太阳 ” 见 图 5， 在 基于 激活 扩 
散 模 型 构建 的 认 知 图 谱 中 并 不 是 权重 值 最 高 的 节点 ,这 表明 经 过 激活 扩散 过 程 各 个 节点 的 权 
重 值 在 整个 图 谱 中 的 地 位 发 生 了 一 些 变 化 , 节点 的 权重 并 不 决定 于 简单 的 频次 全 加 , 而 是 经 
过 激活 扩散 过 程 ， 即 一 系列 复杂 精确 的 计算 后 对 权重 值 进行 的 少量 多 次 地 增加 . 从 图 5 中 我 
们 可 以 看 到 , 在 基于 频次 统计 构建 的 知识 图 谱 中 ,“ 太 阳 ” 节 点 的 权重 由 与 其 相连 的 边 和 节点 
所 贡献 , 但 我 们 缺乏 依据 去 辨认 哪个 节点 哪 条 边 对 “太阳 ”节点 的 权重 贡献 较 大 , 而 从 基于 激 
活 扩散 构建 的 认 知 图 谱 中 , 我 们 可 以 明显 看 到 , 节点 “出 现 ””“ 一 个 ”与 “天 上 ”对 “太阳 ” 
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节点 权重 的 贡献 相 较 于 其 他 节点 较 高 。 可 见 ， 相 较 于 基于 频次 统 赋予 权重 的 认 知 图 谱 ， 基 于 
激活 扩散 模型 赋予 权重 的 认 知 图 谱 具 有 一 定 的 灵活 性 和 更 强 的 细节 揭示 能 力 以 及 强 解 释 力 。 


上 红 影 彤 
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忆 
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图 5 基于 频次 统计 ( 左 ) 与 基于 激活 扩散 模型 ( 右 ) 构建 图 谱 对 比 


5.2 认 知 图 谱 中 的 权重 分 布 差异 


通过 使 用 两 种 方法 对 第 五 组 材料 进行 图 谱 构建 , 并 以 构建 图 谱 中 的 节点 权重 数值 分 布 与 
数量 关系 来 做 散 点 图 , 对 比 两 种 方法 构建 的 图 谱 在 权重 分 布 上 的 差异 。 可 以 得 到 以 下 对 比 图 ， 
见 图 6《〈 其 中 红色 散 点 “x” 为 基于 频次 统计 的 方法 构建 的 图 谱 权重 分 布 ， 蓝 色散 点 “o” 为 
本 研究 提出 的 基于 激活 扩散 模型 的 方法 构建 的 图 谱 权重 分 布 。 
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图 6 第 五 组 的 权重 分 布 对 比 


图 6 中 左 侧 为 认 知 图 谱 中 权重 分 布 相关 情况 , 横 轴 为 节点 权重 , 纵 轴 为 节点 数量 , 图 上 
绘制 点 为 该 节点 权重 所 具有 的 节点 数量 。 右 侧 为 认 知 图 谱 权 重 占 比分 布 相关 情况 ,， 横 轴 为 节 
点 权重 在 节点 总 权重 中 的 占 比 , 纵 轴 为 节点 数量 在 节点 总 数 中 的 占 比 , 图 上 绘制 点 为 节点 权 
重 占 比 对 应 的 节点 数量 占 比 。 


从 图 6 中 可 以 发 现 , 使 用 本 研究 提出 的 基于 激活 扩散 模型 的 认 知 图 谱 构 建 方法 的 权重 分 
布 的 散 点 数量 比 基 于 频次 统计 的 认 知 图 谱 散 点 数量 要 多 , 且 基 于 激活 扩散 模型 的 认 知 图 谱 构 
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建 方法 的 权重 值 分 布 在 较 大 的 范围 , 这 也 再 次 印证 了 基于 激活 扩散 模型 的 认 知 图 谱 中 权重 值 
处 于 不 同 的 权重 层次 水 平 。 权 重 值 多 层次 化 的 结果 就 是 每 个 散 点 的 纵 轴 坐标 ， 即 处 于 该 权重 
值 上 的 节点 数量 变 少 了 , 但 仔细 观察 可 以 发 现 , 散 点 图 的 开始 变化 趋势 仍然 是 一 个 呈现 轻微 
下 降 趋 势 的 三 角形 。 

此 外 , 这 两 种 图 谱 的 权重 分 布 在 图 像 上 都 呈现 先 密集 再 稀疏 的 特点 , 这 表明 图 谱 的 权重 
值 的 分 布 集中 在 权重 较 低 占 比 的 层次 , 权重 值 具有 的 节点 数 也 随 着 权重 值 占 比 普遍 呈现 下 降 
趋势 。 

为 进一步 观察 基于 激活 扩散 模型 构建 的 认 知 图 谱 权 重 分 布 的 特点 , 探究 基于 激活 扩散 模型 
构建 的 认 知 图 谱 的 权重 分 布 图 中 三 角 区 域 形成 的 原因 , 绘制 第 一 组 到 第 五 组 基于 激活 扩散 模 
型 构建 认 知 图 谱 的 权重 占 比 与 节点 数 占 比 的 图 像 如 图 7: 


| 
3 


图 7 基于 激活 扩散 模型 构建 认 知 图 谱 的 权重 分 布 图 

由 上 图 7 可 知 , 基于 激活 扩散 模型 的 认 知 图 谱 规 模 的 逐渐 扩大 ,其 纵 轴 上 的 数量 分 布 出 
现 逐 渐 由 分 层 散 点 形成 了 连续 散 点 的 趋势 , 与 此 同时 , 除了 数量 占 比 较 低 的 图 像 中 最 下 层 的 
散 点 外 , 各 层次 的 散 点 在 横 轴 上 的 范围 随 着 图 谱 规模 的 扩大 都 有 明显 缩短 的 现象 , 这 对 应 了 
其 散 点 层次 的 增多 。 


从 上 图 7 中 可 以 发 现 , 权重 占 比 较 高 的 散 点 处 于 数量 占 比 重 较 低位 置 , 而 数量 占 比 较 高 
的 散 点 则 处 于 权重 占 比 较 低 的 位 置 , 这 一 点 与 使 用 基于 频次 统计 的 认 知 图 谱 构 建 方法 形成 的 
权重 分 布 图 的 规律 是 一 致 的 ， 也 与 无 标 度 网 络 的 规律 相符 合 。 但 不 同 的 是 , 在 基于 激活 扩散 
模型 构建 的 认 知 图 谱 权重 分 布 图 中 存在 着 多 散 点 图 构成 的 “面积 ”， 见 下 图 8， 这 与 认 知 图 
谱 中 权重 数值 分 布 更 广泛 有 关 。 
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图 8 两 种 认 知 图 谱 构建 的 权重 分 布 图 对 比 (2219 节点 ) 
通过 对 两 种 方法 构建 的 认 知 图 谱 绘制 的 权重 分 布 散 点 图 可 以 发 现 , 使 用 基于 激活 扩散 模 
型 构建 的 认 知 图 谱 相 较 于 基于 频次 统计 构建 的 认 知 图 谱 其 图 像 的 下 降 趋 势 一 致 , 都 随 着 节点 
权重 占 比 的 增加 其 节点 个 数 占 比 反而 降低 , 即 在 认 知 图 谱 中 权重 较 高 的 节点 数量 在 认 知 图 谱 
中 占有 少数 ， 而 权重 较 低 的 节点 数量 在 认 知 图 谱 中 占有 多 数 。 


5.3 认 知 图 谱 对 于 因果 不 对 称 性 的 证 明 


人 的 认 知 往往 是 层 层 递 进 的 , 即 不 同 的 学 习 顺 序 产 生 的 学 习 结 果 是 不 一 样 的 。 物理 学 家 
和 信息 理论 学 家 认为 宇宙 系统 中 存在 “因果 不 对 称 性 ”， 在 经 典 计 算 机 领域 ， 计 算 机 软件 更 
容易 预测 某 个 复杂 系统 在 未 来 的 发 展 走向 却 难以 推测 系统 过 去 的 活动 。 即 治 着 时 间 的 茶 一 方 
向 前 进 , 会 比 另 一 方向 需要 更 多 的 信息 和 更 复杂 的 运算 。 瑟 美 曾 将 因果 不 对 称 性 引入 到 概念 
认 知 学 习 领域 , 并 通过 概念 树 可 视 化 来 表示 因果 不 对 称 性 ”。 使 用 本 研究 提出 的 构建 认 知 图 
谱 的 方法 也 具有 可 视 化 认 知 过 程 的 功能 。 为 了 展示 因果 不 对 称 性 , 通过 对 五 篇 篇 章 和 二 十 五 
篇 篇 章 分 别 进行 顺序 和 逆序 输入 , 构建 基于 激活 扩散 模型 的 认 知 图 谱 , 对 比 最 终 形成 的 不 同 
权重 分 配 的 认 知 图 谱 可 视 化 结果 ， 实 验 材 料及 各 组 别 输入 顺序 如 表 2: 


表 2 实验 语 料 


篇 章 及 序号 组 别 实验 语 料 序号 分 配 
1. 嫦娥 奔 月 2. 共 工 触 天 3. 后 翌 射 晶 第 全 组 5 
4. 精 卫 填 海 5. 夸 父 逐日 6. 鲤鱼 路 龙门 4 
7. 走 姜 女 器 长 城 8. 年 的 由 来 9. 女 娲 补 天 3 
10. 铁 拐 李 关 了 鸭 11. 五 指 山 的 由 来 12. 思 公 移 山 2 
13. 钻 木 取 火 14. 八仙 过 海 15. 仓 颜 造 字 1 
16. 大 策 治 水 17. 孔雀 公主 18. 龙 伯 钓 鳌 三 入， 于 到 冲 
19. 龙 女 拜 观 音 20. 牛 即 织女 21. 女 娲 升天 2050 7100 1e 7 i 
22. 女 娲 造 人 23. 盘古 开 天 24. 神农 尝 百草 1 4 ll 
25. 天 将 救 人 间 Wo 07 0 
5 


过 对 上 表 中 的 五 篇 篇 章 和 二 十 五 篇 文章 分 别 进 行 顺序 和 逆序 输入 构建 基于 激活 扩散 
模型 的 认 知 图 谱 可 以 得 到 两 组 认 知 图 谱 可 视 化 结果 如 下 : 


澡 
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顺序 输入 逆序 输入 
图 9 基于 激活 扩散 模型 构建 认 知 图 谱 的 顺序 逆序 对 比 


从 第 一 组 实验 中 ， 我 们 可 以 发 现 ， 节 点 “嫦娥 ”在 顺序 图 谱 中 的 权重 水 平 高 于 逆序 中 的 
权重 水 平 ， 这 可 能 是 由 于 《嫦娥 奔 月 》 处 于 顺序 图 谱 中 的 第 一 篇 ， 而 处 于 道 序 图 谱 中 的 最 后 
一 篇 。 节 点 “ 共 工 ”在 顺序 图 谱 中 的 权重 水 平 也 要 高 于 在 逆序 图 谱 中 的 权重 水 平 ， 也 可 以 解 
释 为 《 共 工 触 天 》 在 顺序 图 谱 中 的 第 三 篇 ， 在 逆序 图 谱 中 为 第 四 篇 。 这 里 的 权重 水 平 并 非 完 
全 代表 权重 值 的 大 小 , 而 是 在 图 谱 网 络 中 节点 的 相对 地 位 , 并 且 存 在 图 谱 中 某 节 点 对 比 另 一 
个 图 谱 中 的 该 节点 权重 水 平 高 但 权重 值 低 的 情况 , 例如 “ 共 工 ”节点 ,在 顺序 图 谱 中 权重 值 
164. 27， 在 逆序 图 谱 中 权重 值 168. 65， 但 通过 与 整个 图 谱 的 最 高 节点 权重 进行 比较 产生 的 
颜色 映射 可 以 发 现 ， 顺 序 图 谱 中 节点 “ 共 工 ”的 权重 水 平 要 高 于 逆序 图 谱 中 节点 “ 共 工 ”的 
权重 水 平 。 当 然 这 种 规律 并 非 会 造成 绝对 的 可 视 化 结果 ， 由 于 激活 扩散 模型 的 灵活 性 , 仍然 
存在 多 种 可 能 结果 ,一 个 节点 在 图 谱 中 的 权重 水 平 不 仅 取 决 于 该 节点 以 及 与 其 相连 的 其 他 节 
点 ， 也 取决 于 随后 输入 的 文本 材料 ， 更 受到 随后 输入 的 文本 材料 顺序 的 影响 。 


第 二 组 通过 对 二 十 五 篇 文章 进行 顺序 输入 和 逆序 输入 , 可 以 更 明显 发 现 权重 分 布 的 不 同 ， 
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随 着 篇 章 输 入 的 增多 , 篇 章 主题 节点 的 权重 将 不 会 成 为 较 高 权重 水 平 的 节点 , 这 主要 是 由 于 
随 着 篇 章 数 增多 ,一些 相 同 概念 出 现在 不 同 篇 章 中 ,将 成 为 更 多 周围 节点 的 枢纽 ,成 为 出 现 
频次 更 多 的 节点 ,这 种 节点 将 在 图 谱 中 占有 较 高 的 权重 ,这 些 概 念 通常 为 句子 中 常见 的 词语 。 

过 顺序 、 逆序 分 别 构建 基于 激活 扩散 模型 的 认 知 图 谱 并 对 节点 权重 值 进行 排序 , 对 一 些 无 
意义 虚词 进行 过 滤 后 可 以 发 现 其 排名 前 20 的 节点 如 下 《25 篇 文本 共 形 成 2219 个 节点 2225 
2 


表 3 顺序 逆序 权重 排名 前 20 节点 对 比 


顺序 逆序 
冰 启 权重 值 用 局 权重 值 
变 成 * 1005. 18 一 个 # 909. 79 
一 个 # 999. 63 自己 * 722. 38 
来 到 971. 91 劳动 508. 12 
地 方 802. 24 和 尚 M2ON23 
精 ; 750. 33 太阳 400. 66 
英雄 696. 58 姑娘 * 334.59 
剥 娥 581. 69 人 间 312. 44 
妻子 563.5 大 地 306. 51 
姑娘 # 554. 01 生活 # 289. 67 
潜 花 484. 49 玉皇大帝 272.33 
自己 x* 461. 42 上 山 265528 
生活 # 402. 02 DB 245. 13 
女 娲 *# 389. 38 采 烦 242. 86 
也 们 377.54 召 树 屯 239. 24 
人 们 # 376.15 世界 233.84 
盘古 # 326. 45 巨人 227. 68 
老百姓 285. 4 变 成 * 221. 26 
企盼 280. 85 人 们 * 220. 45 
没有 256. 39 蝇 古 六 21336 
那里 250. 64 女 娲 洒 i251 


经 过 对 比 可 以 发 现 ， 正 序 和 逆序 中 权重 排名 前 20 的 节点 范围 内 的 共同 节点 有 8 个， 分 
刘 定 和 2 
论 在 顺序 图 谱 和 逆序 图 谱 中 都 处 于 较 高 权重 水 平 , 而 范围 内 的 其 余 节 点 由 于 受到 了 输入 顺序 
影响, 不同 程度 地 发 生 了 权重 水 平 的 变化 。 这 即 表明 了 基于 激活 扩散 模型 构建 认 知 图 谱 凸 
显 高 权重 节点 的 可 靠 性 , 又 展现 了 该 构建 方法 的 灵活 性 。 相同 篇 章 在 不 同 顺 序 输 入 下 会 形成 
不 同 权重 分 配 的 认 知 图 谱 , 这 是 由 于 激活 扩散 模型 本 喘 符合 这 种 认 知 规律 , 即 先 纳入 图 谱 的 
节点 在 刚 开始 时 会 具有 更 多 被 激活 的 机 会 ， 从 而 在 早期 会 获得 更 多 的 权重 。 这 种 规律 也 符合 
马 太 效应 的 现象 , 即 先 放 入 网 络 中 的 节点 度 值 相对 于 后 面 节 点 来 说 呈现 霸 指 数 的 增长 , 即 一 
个 节点 越 早 放 入 网 络 中 积累 的 连 边 越 多 ,而 这 种 不 同 顺 序 导致 不 同 的 可 视 化 结果 表明 使 用 该 
方法 构建 的 认 知 图 谱 可 以 证 明 因果 不 对 称 性 。 
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6 结语 


本 文 针 对 当前 认 知 图 谱 缺 乏 认 知 智能 的 困境 , 提出 了 基于 激活 扩散 模型 构建 认 知 图 谱 的 
方法 , 通过 设计 激活 扩散 过 程 赋予 认 知 图 谱 节 点 不 同 强 度 的 权重 值 , 以 此 作为 认 知 图 谱 检索 、 
E 理 的 相关 依据 。 通 过 对 本 文 所 提出 基于 激活 扩散 模型 构建 的 认 知 图 谱 与 基于 频次 统计 的 认 
知 图 谱 进行 对 比 实验 , 结果 显示 本 文 提 出 的 认 知 图 谱 赋 予 的 图 谱 节 点 权重 的 机 制 因为 在 细节 
揭示 能 力 上 优 于 基于 频次 统计 构建 的 认 知 图 谱 而 具有 强 解释 力 , 且 其 权重 值 更 具有 多 层次 性 ， 
可 以 降低 认 知 负荷 ， 整 个 认 知 图 谱 模拟 人 的 认 知 结构 ， 上 共有 灵活 性 的 特征 ， 此 外 ， 该 认 知 图 
谱 演化 结果 与 输入 材料 顺序 相关 的 特性 也 可 以 证 明 因 果 不 对 称 性 。 


本 文 提 出 的 认 知 图 谱 可 以 应 用 于 多 个 场景 ， 例 如 知识 推荐 、 知 识 检索 、 知 识 问答 等 。 对 
认 知 图 谐 赋 予 权 值 是 对 认 知 图 谱 认 知 智 能 的 一 次 优化 , 最 直接 的 应 用 是 优化 后 的 认 知 图 谱 可 
视 化 将 携带 权重 信息 ， 从 而 帮助 认 知 图 谱 进 行 认 知 推理 和 判断 。 


本 研究 所 构建 的 认 知 图 谱 具 有 不 受 领域 限制 的 特点 , 尤其 是 激活 扩散 进程 , 由 于 符合 认 
知 规律 可 以 应 用 于 各 个 领域 的 认 知 图 谱 构 建 中 ,但 这 也 表明 其 存在 着 赋 权 机 制 考虑 条 件 过 于 
单一 的 问题 , 由 于 节点 类 型 并 未 区 分 重要 程度 , 所 以 在 构建 需要 对 节点 进行 分 类 处 理 的 认 知 
图 谱 时 存在 不 足 ， 此 时 需要 设计 与 扇 出 限制 的 激活 扩散 有 关 的 激活 扩散 进程 , 这 需要 在 未 来 
的 工作 中 进一步 讨论 。 
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